“By far, the greatest danger of Artificial Intelligence is that people conclude too early that they understand it.” —Eliezer Yudkowsky
首先,我們要有一個清楚的概念,那就是:你的模型的輸入長怎樣,你預測的輸入就必須長怎樣!
因為對電腦來說,圖片就只是一堆像素點。
左圖的圖片是我們訓練模型時的輸入的樣子,右圖則是手機拍的圖片。
所以我們的目的就是要盡量把右圖變成左圖的樣子!
要做這件事情,就必須用到一些影像處理的知識:
首先,由於我們要做一些影像處理,如果直接把圖片縮小到28 * 28會不好觀察也不好操作,所以先變成512 * 512。
再來是做減少陰影干擾,會先定義用於形態學(Morphology)的矩陣,接下來做閉運算(Closing)後再正規化。
接下來做Canny,Canny會找出圖片的邊。
再來使用膨脹(Dilate),將前一張Canny完後的圖做膨脹,可以讓白點往外擴展。
然後用Contour,將我們原本的圖替換成,做完Contour後我們想要的部分。
最後把512 * 512的圖縮小到784 * 1 或 28 * 28(取決你是用ANN還是CNN)
篇幅問題,關於影像處理的部分就不多做深入了,下一篇進入小結!